查看原文
其他

中心化vs去中心化,数据存储的正确姿势

Crust Crust分布式云 2020-11-11
Crust 实现了去中心化存储的激励层协议,适配包括 IPFS 在内的多种存储层协议,并对应用层提供支持。同时 Crust 的架构也有能力对去中心化计算层提供支持,构建分布式云生态。



我们一直在说 5G、云计算、大数据、物联网等大科技板块未来的趋势和机会,但不知道大家想过没有,这些应用未来发展起来后,数据量也会呈指数级增长。


以今年春节为例,单移动互联网流量同比就增长了 37%,其中除夕和大年初一两天数据流量更是翻倍。


再试想一下,如今各种网红直播、在线+产业(教育、办公、医疗等)以及抖音、快手等 APP 上面的短视频,哪一个数据流量是低于 M 级别。


有数据就有存储需要,随着数据量增加,未来数据存储需求也会水涨船高,而且数据存储作为多个新兴战略产业的基础设施,需求量会更大更确定,只要下游任何一个产业还在规模扩张,需求就不会萎缩。

根据 IDC 预测,全球数据将从 2018 年的 32ZB 增长至 2025 年的 175ZB,单位 ZB 看不懂的话,看增幅就好了,7 年 5 倍多的增幅,成长空间非常巨大且确定。

其中,中国数据增长将最为迅速,2018 年为 7.6ZB,预计到 2025 年将增至 48.6ZB,占全球 28% 的比例,年复合增速 30.4%,这样的增速已经超过云计算了。



01. 存储


中心化存储和去中心化存储有什么异同,下面用四个形象化的例子来说明。

 
1. 有个出租车公司,车子平时停在仓库里。当有用户需要用车时,需要打电话到出租车公司,然后公司统一派车。但如果车库是固定的几个地点,那么一些地区的乘客可能需要等很久车才会来。

这时候滴滴公司出现了,私家车可以线上接单。因为私家车主足够的分散。当乘客打开 APP 发起订单后,系统会调度最近的车主接单。

分布式系统的速度优势:集中式的管理虽然降低了系统成本,但同时也因为地点的单一和固定牺牲了中远端的速度性能)。
 
2. 在滴滴出行问世之前,“黑头车”一直是出租车主们愤怒和无奈的存在。究其原因,就是出租车业务无法满足用户的出行服务,车辆少、费用高,这给了黑头车们顽强不息的生命力。

统筹车主并解决安全隐患这件事做成之后,“黑头车”便成了滴滴,闲置在家中的汽车便成了市场出行需求的强力补充。既解决了双方各自的需求,也有效提高了闲置资源的利用率。

共建共享的模式优势:资源共建共享模式能在最大限度满足用户需求的情况下,提高资源的利用率,同时也最大限度地为各方用户提供服务。
 
3. 出租车公司出于成本控制的考虑,更多的是采购油耗低,皮实耐用,性价比高的车辆,在满足出行需求的基础上一般不考虑满足舒适度等小众需求,就像90年代中国内地二三线城市的“蹦蹦车“:我可以帮你送达目的地,但是我只能这么快。

而像百度这样的数据中心。同样出于宽带瓶颈考虑,能够给到非付费用户的速度也非常有限,这是一个和这个时代远不相符的速度。

分布式系统的成本优势:不必花费高昂成本堆积单中心节点的性能,同时 P2P 网络还会有效降低单节点压力,加速传输能力。
 
4. 由于出租车公司是统一的出租车型,车上前后排没有阻隔。理论上,所有乘客乘车和聊天都会被行车记录仪监听到。

而滴滴则开放各种车型,有的车主在前后排之间用隔音构造私人空间,带来舒适的私密体验从而获得额外的服务收入(加密算法能够起到保护数据隐私作用)。
 
综上,去中心化存储相比较于中心化存储,其优势表现在:

a) 去中心化存储地理位置更加分布,更加靠近边缘侧,响应速度更快。
b) 天然支持P2P加速等技术,让文件读取更快。
c) 中心化存储可能出现资源闲置或者资源不足。无法很好的应对未来很多 5G 和边缘计算场景。
d) 去中心化存储,数据泛在化,可以有效降低带宽成本。

e) 中心化存储,用户数据主权在服务提供方,隐私没有保障,比如李小璐的抖音草稿箱里视频被盗、Facebook 用户数据被滥用等例子表明,中心化的存储无法有效的保证用户隐私。


接下来,我们将数据属性分为两大类:公共数据和私有数据。对比中心化存储和去中心化存储的主要区别。



02. 公共数据

公共数据主要是对全人类有价值的数据,比如电影,书籍(这里不展开讨论版权问题)以及天气预报等。这一部分数据的去中心化的途径主要是共享。Filecoin 基于 IPFS 技术在这个方向做出了巨大努力。

公共数据在两种存储方式下的主要区别
 
星际文件系统 IPFS(InterPlanetary File System),定义了包含数据对象、路由以及交换等多层协议。基于 DHT、BitSwap 等技术,IPFS 网络中的节点可以去中心化的共享全网的文件。但由于节点的进出以及文件的增减,一定程度上会对网络带来性能损耗。Filecoin 项目的一大目的就是激励节点保持文件的可用。

近期上线的 Filecoin Discover 项目(https://ipfsdrop.com/offcial/filecoin-discoverxiangmukaiqichengweijilikuanggongdeyidashaqi-diandizixun/)中,Filecoin 团队整理了海量的车联网、气象学、生物基因、珍贵书籍等对全人类都有价值的数据。提供给矿工进行存储,并激励节点保持在线,维护这些数据在IPFS网络的可用性。


03. 私有数据

有的数据,对某些人很重要,但其他人可能并不关心,或者数据主人并不希望被其他人获得。比如自己和家人的照片,企业的生产数据等。这些数据,我们定义为私有数据。

私有数据的去中心化过程中,我们需要更多的考虑用户的隐私和数据的主权问题。

私有数据在两种存储方式下的主要区别

Crust 一方面会兼容 IPFS,致力于有价值数据的共享,同时,也兼顾对私有数据的隐私的保护。基于 TEE 技术,Crust 对芯片级别的加密和访问控制有着天然的支持。用户在享受去中心化存储带来的降本增效的同时,还能从技术上保证用户隐私的安全。


Modified on

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存